in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-10-29 11:18:23
.
AIbase
.
12.8k
वीडियो समझने के क्षेत्र में एक काले घोड़े का उदय! Video-XL यह मॉडल एक घंटे तक के वीडियो को संभाल सकता है!
वर्तमान में, बहु-मोडल बड़े भाषा मॉडल (MLLM) वीडियो समझने के क्षेत्र में महत्वपूर्ण प्रगति कर रहे हैं, लेकिन अत्यधिक लंबे वीडियो को संभालना अभी भी एक चुनौती बन हुआ है। इसका कारण यह है कि, MLLM आमतौर पर अधिकतम संदर्भ लंबाई से आगे बढ़ने वाले हजारों दृश्य टैग को प्रबंधित करने में कठिनाई महसूस करते हैं, और टैग समेकन के कारण होने वाली जानकारी में कमी से प्रभावित होते हैं। साथ ही, बड़ी मात्रा में वीडियो टैग भी उच्च गणनात्मक लागत लाते हैं। इन समस्याओं को हल करने के लिए, ज़ियुआन अनुसंधान संस्थान ने शंघाई जियाओ टोंग यूनिवर्सिटी, चीन की पीपुल्स यूनिवर्सिटी, पीकिंग यूनिवर्सिटी और बीजिंग邮电大学 जैसे कई विश्वविद्यालयों के साथ मिलकर Vide पेश किया।